AI资讯新闻榜单内容搜索- AI

Claude 3.7硬控马里奥90秒，GPT-4o开局暴毙！Karpathy直呼基准失效，游戏成LLM新战场

Karpathy发出灵魂拷问，评估AI究竟该看哪些指标？答案或许就藏在经典游戏里！最近，加州大学圣迭戈分校Hao AI Lab用超级马里奥等评测AI智能体，Claude 3.7结果令人瞠目结舌。

来自主题: AI资讯

8592 点击 2025-03-03 16:00

扎克伯格这款不会发售的新品，又在探索 AI 眼镜的终极形态

扎克伯格也有「暗部」。

来自主题: AI资讯

7903 点击 2025-03-03 09:47

AI+居家养老，融资4.2亿美元，住院率降70%，政府凭啥买单？

在老龄化浪潮和医疗系统承压的双重挑战下，居家养老成为破局关键。英国 Cera Care 独辟蹊径，以 AI 技术驱动数字化平台，不仅与政府深度合作，更实现住院率降低70%的医疗奇迹，日节省百万英镑，为深陷困境的英国医疗体系带来效率革命。

来自主题: AI资讯

9572 点击 2025-03-01 10:52

开源的胜利！RISC-V与AI今日全面「会师」

RISC-V 正在成为 AI 原生计算架构。

来自主题: AI资讯

6245 点击 2025-02-28 14:51

谷歌发布BIG-Bench超难基准：DeepSeek-R1得分6.8，只有o3-mini超过10分

随着 AI 能力的提升，一个常见的话题便是基准不够用了——一个新出现的基准用不了多久时间就会饱和，比如 Replit CEO Amjad Masad 就预计 2023 年 10 月提出的编程基准 SWE-bench 将在 2027 年饱和。

来自主题: AI技术研报

6411 点击 2025-02-28 14:48

前DeepMind大佬创业，做出喜怒哀乐以假乱真的AI语音大模型

未来又该如何分辨是AI还是真人在说话？

来自主题: AI资讯

10558 点击 2025-02-28 10:45

被Github 上的Stable Diffusion 坑惨了？失业、欠帐、恐慌，工程师怒喷：AI软件毁了我

这位曾用代码构建童话世界的工程师，被困在了由 AI 工具引发的一场噩梦里。

来自主题: AI资讯

7601 点击 2025-02-28 10:27

扣子平台智能体与 AI 应用数据分析报告

这是智能体平台扣子官方整理的AI应用的相关数据，该报告可以让大家更好的了解用户在智能体方面的创建情况，同时也可以了解智能体平台本身的用户情况，更清楚的分析智能体商业的前景。

来自主题: AI技术研报

10629 点击 2025-02-28 10:04

不要自回归！扩散模型作者创业，首个商业级扩散LLM来了，编程秒出结果

当前的 AI 领域，可以说 Transformer 与扩散模型是最热门的模型架构。也因此，有不少研究团队都在尝试将这两种架构融合到一起，以两者之长探索新一代的模型范式，比如我们之前报道过的 LLaDA。不过，之前这些成果都还只是研究探索，并未真正实现大规模应用。

来自主题: AI技术研报

11824 点击 2025-02-27 14:40

OpenAI 都在用的 AI 招聘，2 年内实现 7500 万美元 ARR

Mercor 是一家由三位 21 岁的 Thiel Fellows 创办的 AI 招聘初创公司，是科技行业增长最快的公司之一，去年 9 月 ARR 月增长率已经达到 50%，到目前，公司已经实现了 2 年内达到 7500 万美元 ARR 的突破，主要收入来自包括 OpenAI 在内的 AI 实验室。Mercor 近期完成 1 亿美元 B 轮融资，估值达到 20 亿美元。

来自主题: AI资讯

10494 点击 2025-02-27 11:34